本篇文章同步發布於 Python pandas 選取與更變 DataFrame 欄位【Python 處理 Excel #3】
這篇文章介紹 Python pandas 套件如何對 DataFrame 選取特定欄位、更變欄位順序與欄位名稱。
文章中使用 example.xlsx 作為說明用的案例資料。example.xlsx 的內容如下:
order_id | create_date | order_quantity | unit_price | requested_ship_date |
---|---|---|---|---|
10000 | 2024/6/5 | 45 | 1000 | 2024/7/3 |
10001 | 2024/6/6 | 165 | 1000 | 2024/7/14 |
10002 | 2024/6/13 | 265 | 1200 | 2024/7/31 |
10003 | 2024/6/15 | 120 | 1000 | 2024/7/13 |
10004 | 2024/6/16 | 115 | 1000 | 2024/7/31 |
以選取 order_id
欄位為例:
import pandas as pd
# 讀取 Excel 檔案
df = pd.read_excel('example.xlsx')
# 選取單個欄位
order_id = df['order_id']
# 顯示前五個 order_id
print(order_id.head())
order_id
的欄位,這將返回一個 Pandas Series。有時候 DataFrame 的欄位太多,只想要選其中幾個欄位進行處理。以下以選取 order_id
和 order_quantity
欄位為例:
# 選取多個欄位
selected_columns = df[['order_id', 'order_quantity']]
# 顯示前五個數據
print(selected_columns.head())
order_id
和 order_quantity
兩個欄位,這將返回一個新的 DataFrame,其中僅包含這些選取的欄位。更變欄位順序和選取多個欄位的概念很像,選取欄位時將欄位按照想要的順序排序列出,並重新指定給 DataFrame,DataFrame 中的欄位順序也會跟著改變了。以下示範如何更變欄位順序:
# 更變欄位順序
new_order = ['order_id', 'order_quantity', 'unit_price', 'create_date ', 'requested_ship_date']
df = df[new_order]
# 顯示前五個數據
print(df.head())
df
。有時候更變欄位名稱能讓人更容易理解數據。以下以將 requested_ship_date
改為 ship_date
為例:
# 更變欄位名稱
df.rename(columns={'requested_ship_date': 'ship_date'}, inplace=True)
# 顯示前五個數據
print(df.head())
requested_ship_date
更變為 ship_date
。False
則會返回一個新的 DataFrame。rename
函數能夠更改 DataFrame 中的欄位名稱。本篇文章同步發布於 Python pandas 選取與更變 DataFrame 欄位【Python 處理 Excel #3】